FSDrive统一VLA和世界模型,推动自动驾驶迈向视觉推理 面向自动驾驶的多模态大模型在 “推理链” 上多以文字或符号为中介,易造成空间 - 时间关系模糊与细粒度信息丢失。FSDrive(FutureSightDrive)提出 “时空视觉 CoT”(Spatio-Temporal Chain-of-Thought),让 模型 推理 vla fsdrive 统一vla 2025-09-30 18:10 2